FILTER MODE ACTIVE

#визуальное рассуждение

Найдено записей: 4

#визуальное рассуждение06.09.2025

FineVision: Hugging Face выпустил открытый датасет на 24 млн примеров для обучения VLM

Hugging Face открывает FineVision — большой мультимодальный датасет на 24,3 млн сэмплов, который повышает точность VLM и минимизирует утечку данных.

ЧИТАТЬ →

#визуальное рассуждение25.06.2025

ByteDance представляет VGR: продвинутая мультимодальная модель с улучшенным визуальным рассуждением

ByteDance представила VGR — мультимодальную модель, которая динамически интегрирует визуальную информацию в процесс рассуждения, значительно улучшая точность и эффективность на бенчмарках зрения и языка.

ЧИТАТЬ →

#визуальное рассуждение10.06.2025

VeBrain: Революция в робототехнике с объединённым мультимодальным ИИ для зрения и управления

VeBrain представляет единую мультимодальную систему ИИ, которая сочетает визуальное рассуждение и управление роботами, демонстрируя выдающиеся результаты в сложных реальных задачах.

ЧИТАТЬ →

#визуальное рассуждение31.05.2025

Бенчмарк PHYX выявляет пробелы в физическом рассуждении мультимодальных моделей ИИ

Бенчмарк PHYX выявляет ключевые слабые места в способности современных мультимодальных моделей ИИ выполнять физическое рассуждение, подчеркивая сложность интеграции визуальных данных с символическими и причинными знаниями.

ЧИТАТЬ →